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Методология анализа данных, основанная 
на многоэтапной нечеткой кластеризации 


В статье предлагается методология многоэтапного применения нечетких методов автоматической 
классификации в задачах интеллектуального анализа и обработки многомерных данных. Приводится 
результат вычислительного эксперимента при анализе искусственного набора данных и сформулированы 
предварительные выводы. 


Введение 


При решении различных социально-экономических задач, при проектировании 
разнообразных технических устройств и в процессе моделирования сложных систем 
особая роль отводится решению задач классификации, для решения которых традицион- 
но применяются методы кластерного анализа, именуемые также методами распознавания 
образов с самообучением или методами автоматической классификации. Обрабатываемая 
информация зачастую оказывается неточной, нечеткой и противоречивой, что требует 
обращения к нечетким и возможностным методам автоматической классификации [1-4], в 
которых, в отличие от традиционных методов кластеризации, указывается степень 
принадлежности объекта кластеру, выражаемая, как правило, величиной из единичного 
отрезка вещественной прямой, что позволяет получить, с одной стороны, точные, а с 
другой — содержательно осмысленные результаты решения задачи классификации. 

Вместе с тем кластеризация служит лишь средством решения задачи простой 
типологизации, то есть выявления стратификационной структуры исследуемой совокуп- 
ности объектов, основанной на представлении классифицируемого множества в виде 
однородных групп объектов [5]. В таком случае решение задачи классификации 
является необходимым этапом исследования, предваряющим решение задачи 
структурной типологизации, то есть исследования структуры взаимосвязей получен- 
ных классов, включающего построение соответствующих иерархических систем — 
как на элементах классифицируемого множества, так и на классах элементов [5]. 
Таким образом, осуществление структурной типологизации множества объектов 
Х={х.....х„} предполагает построение структурной классификационной схемы, кото- 


рая определяется составляющими ее классами и взаимодействиями между классами -— с 
одной стороны, а также объектами в пределах каждого класса — с другой. 

Собственно задача структурной типологизации множества объектов не является 
новой —в [5] рассмотрены разнообразные варианты конечных прикладных целей для 
данной задачи классификации и изложен мощный статистический аппарат для ее 
решения. Однако в случае обращения для решения указанной задачи к методам 
нечеткой кластеризации представляется необходимым учитывать специфические 
особенности этих методов, связанные, в первую очередь, с интерпретацией результа- 
тов нечеткой кластеризации. 
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Целью данной работы является разработка общей схемы последовательного при- 
менения различных методов нечеткой и возможностной кластеризации в процессе 
анализа данных для решения задачи структурной типологизации исследуемой сово- 
купности объектов. 


Краткий обзор методов нечеткой кластеризации 


Как и в традиционных методах кластерного анализа, в рамках нечеткого подхода к 
решению задачи автоматической классификации выделяются эвристическое, оптимиза- 
ционное и иерархическое направления. Наиболее распространенным подходом к ре- 
шению нечеткой модификации задачи автоматической классификации является опти- 
мизационный подход, методы которого предусматривают нахождение оптимального, в 
смысле используемого критерия качества О(Р(Х)), разбиения Р“(Х)={А'...А“} на 
заданное число с нечетких кластеров, описываемых функциями принадлежности д,, 
1[=1,....с, 1=1...п, определенных на исследуемой совокупности объектов Х = {х,,...,х,}, 
так что задача нечеткой кластеризации заключается в нахождении экстремума целевой 
функции О(Р(Х)), что в общем виде описывается формулой 


О(Р(Х)) > т (1) 


где П -— множество всех возможных нечетких разбиений Р(Х) множества класси- 
фицируемых объектов Х , при ограничениях, определяемых условием 


О ЕЕ ЕЕ. (2) 
11 


именуемым также условием нечеткого с -разбиения или нечеткого разбиения в смысле 
Распини [3], которое описывается матрицей Р.„ =[ш,], где и, =и„(х,) — значение 


принадлежности элемента х, е Х некоторому нечеткому кластеру А' Е {А',..., А°}. 


При выборе вида функционала О(Р(Х’)) для проведения исследования учитывает- 


ся, в первую очередь, вид матрицы исходных данных, а также вид шкалы, в которой 
измерены признаки объектов исследуемой совокупности. В силу ограниченности 
изложения дальнейшее рассмотрение предлагаемой методологии будет проводиться 
исходя из предположения, что исходные данные описываются матрицей «объект- 


признак», имеющей вид Х„„„=[х,], 1=1.....п, #=1,...т, так что каждый объект хеХ 
может рассматриваться как точка в т -мерном признаковом пространстве /”(Х). В 


случае, когда исходные данные представлены в форме матрицы «объект-объект» 
Ри =[Р5], ЬЛ=Ъ....п, где общее обозначение р, используется вместо значений 


взаимных расстояний 4, или коэффициентов сходства 7, между объектами, общая 


схема анализа данных не претерпевает принципиальных изменений. 

В случае, когда данные об исследуемой совокупности описываются матрицей 
вида «объект-признак», большинство критериев качества нечеткого разбиения в 
общем имеют вид 


ОКР) =УУ шах, (3) 


1=1 1= 
где х — элемент исследуемой совокупности, 7’ - прототип нечеткого кластера 


1 тва 
А'=Р"(Х), и, как правило, в качестве 4(х,,т’) используется квадрат какого-либо расс- 
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тояния. Как отмечает И.Д. Мандель, функционал (3) представляет собой «наиболее 
распространенный и изученный вариант экстремальной постановки задачи кластер-ана- 
лиза в терминах размытых множеств» [6]. Некоторые модификации критерия (3) при- 


ведены в табл. 1. 


Таблица 1 — Критерии качества нечеткого с -разбиения 


Вид критерия 


Параметры алгоритма 


Ссылка 


и (РТ =УУ 


15 1= 


—12 
х-7 | 


2<с<п - число классов; 
1<у << -— показатель 


нечеткости; 


[1] 


ОНИ (Р,Т) — уу 


1 1= 


2 
=1 
х-7| - 


2<с<пи - число классов; 
1<у << -— показатель 
нечеткости; 

0<6 <1 -— параметр 
однородности; 


7] 


а 1 [6 Ш 
из(Р.Т)=- >. 


1 1= 


2<с<пи - число классов; 

1<у << - показатель 

2 нечеткости; 

0< 6 -— параметр классификации; 


[8] 


г (РТ)=УУ м 


[51 15 
-СУ в 


1 1= 


2 
—1 
в-т| - 


2<с<пи - число классов; 

1<у << - показатель 
нечеткости; 

0 < - параметр классификации; 


[9] 


Одной из главных проблем при использовании оптимизационных методов явля- 
ется определение «реального» числа с нечетких кластеров, на которые «расслаивается» 
исследуемая совокупность, или, иными словами, проблема обоснования числа кластеров, 
встающая наиболее остро, когда исследователю число классов с вообще неизвестно. 
Для решения этой проблемы были предложены различные показатели, характери- 
зующие получаемое при использовании того или иного алгоритма нечеткое разбиение 


Р'(Х)={А....А. В частности, при поиске нечеткого с -разбиения с помощью ЕСМ-алго- 


ритма, минимизирующего приведенный в табл. | критерий Ол. (Р,Т), а также его моди- 


фикаций [1], [2], были предложены различные показатели, ряд которых приведен в табл. 2. 


Таблица 2 — Показатели оптимальности числа классов в нечетком с -разбиении 


Наименование Решение 
Вид показателя Ссылка 
показателя задачи 
Коэффициент СТА 2 тах(/ (Р 
разбиения РР) = п 22. с = й [10] 
Показатель Е 2 и; (х, — р. Хх, — ру 
нечеткого Г,(Р)= у дей = я тиа(И, (Р )) ПИ 
гиперобъема в! № р 
1=1 
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Продолж. табл. 2 


[6 Ш Г Ш 
Показатель р. хи т | - в) >. и , 
толщины Г (Р=—м - = пил, (Р)) [12] 
оболочки К, 
= С 
тасе т. ('-7)@'-г): 
= 1= 
Показатель ТЦ) = з 
компактности и > Уи ЕЕ) плах(И., (Р)) [13] 
разделимости У`тасе = 
1=1 7 
и 
>, 


Если исходные данные представлены в форме матрицы «объект-объект» 
Р„„ =[;]5 51=Ъ...п, то для решения задачи нечеткой кластеризации используются 


неметрические алгоритмы и соответствующие им показатели оптимальности числа 
классов, ряд которых рассматривается в работах [3], [4]. 

Касательно методов нечеткой кластеризации иерархического направления следует 
отметить, что соответствующие кластер-процедуры отличаются достаточно большим 
разнообразием -— к примеру, различные иерархические кластер-процедуры основаны на 
различных определениях иерархии [14], [15], а относительно алгоритмов эвристического 
направления нечеткой кластеризации необходимо указать, что, как и в случае традицион- 
ного подхода к решению задачи автоматической классификации, эвристические методы 
нечеткой кластеризации играют большую роль на этапе разведочного анализа данных 
[5] - к примеру, МСМ-алгоритм приближенной кластеризации [16] используется для 


определения числа классов с в искомом нечетком с-разбиении Р“(Х) и инициализации 


прототипов 7’, [=1,...с для последующей обработки данных оптимизационными мето- 


дами нечеткой кластеризации, а О-АЕС-ТС-алгоритм возможностной кластеризации 

17}, [18] применяется для построения множества значений наиболее возможного числа 
1 

нечетких кластеров А’, /=1,...с вискомом Р“(Х) [19]. 


Этапы структурной типологизации 


Как указывалось выше, осуществление структурной типологизации предусматри- 
вает построение иерархий классов, а также иерархий объектов — элементов классов. 
В силу того, что иерархические кластер-процедуры обладают особенностью, заключающей- 
ся в резком возрастании, с ростом количества объектов классифицируемой совокупности, 
времени вычислений и требований к объему оперативной памяти ЭВМ, алгоритмы иерар- 
хического подхода применимы для классификации совокупностей объектов сравнительно 
небольшого объема и не могут быть прямо использованы для структурной типологизации 
больших массивов данных. Таким образом, проведение исследования с целью осущест- 
вления структурной типологизации множества объектов предполагает ряд этапов: 

1) разбиение множества объектов на априори известное, или нет, число с классов; 

2) построение иерархии на элементах каждого класса полученного разбиения; 

3) построение иерархии классов полученного разбиения. 
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Указанные этапы структурной типологизации исследуемой совокупности объек- 
тов и последовательность их осуществления схематично изображены на рис. 1. 


Рисунок 1 — Этапы осуществления структурной типологизации исследуемой 
совокупности объектов 


Следует отметить, что в случае, когда число классов с априори неизвестно, то 
представляется необходимым проведение разведочного анализа данных с целью установ- 


ления числа классов с, либо подмножества С={с.,...с’} возможных значений числа клас- 


сов в искомом разбиении. Кроме того, если число классов оказывается сравнительно 
незначительным, а число объектов, попавших в каждый класс, достаточно велико, то 
этап разбиения на классы может быть повторно применен уже к множествам объектов — 
классам полученного разбиения; при этом возникает необходимость установления числа 
субкластеров в каждом классе и построение иерархии субкластеров в пределах каждого 
класса, что позволит проводить детальное исследование структуры классифицируемой 
совокупности. 

В свою очередь, при построении иерархии классов в рамках структурной классифи- 
кационной схемы, каждый класс может быть представлен либо его геометрическим 
центром, или, иными словами, прототипом, либо некоторым типичным для того или 
иного класса элементом, при этом нужно также отметить, что, помимо иерархических 
кластер-процедур, для выявления межкластерных связей могуг применяться алгоритмы 
классификации на графах. 

Необходимо, однако, указать, что в ситуации, когда искомая кластерная структура 
характеризуется таким видом неопределенности, как размытость [3], что требует 
обращения к методам нечеткой кластеризации, возникает проблема выделения значимых 
частей нечетких кластеров полученного в результате реализации первого этапа нечет- 


кого с-разбиения Р“(Х) с целью проведения дальнейшего исследования и реализации 
второго и третьего этапов. 
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Концепция @-ядер нечетких кластеров 


При обращении к оптимизационным методам нечеткой кластеризации, в силу усло- 

вия нечеткого с -разбиения (2) каждому объекту х. еХ будет соответствовать вектор при- 
< * 

надлежностей (д,,...й.,) классам полученного нечеткого с -разбиения Р’(Х)={А',...А}, 


вследствие чего возникает проблема интерпретации результатов классификации, то есть 
отнесения того или иного объекта к возможно меньшему числу классов. Наиболее 
распространенным методом интерпретации результатов является дефаззификация мат- 
рицы Р.„=[и,| нечеткого с -разбиения по правилу максимального значения принад- 


лежности, выражаемого соотношением 
ММ 
ПИ а етаь (4) 


так что значениями принадлежности и» матрицы РМ" 


являются числа 0 и 1. Однако 
подобный подход является неприемлемым, если для некоторого объекта хе Х его 
значения принадлежностей составляют /4, =Ус, 1=1,....с. Кроме того, недостатком ука- 


занного подхода является утрата значений принадлежности объектов нечетким клас- 
терам, позволяющая содержательно интерпретировать результаты кластеризации. 

В свою очередь, концепция &@ -ядер нечетких кластеров, предложенная в [20], 
предполагает нахождение такого порога @ , @ Е (01|, чтобы выполнялось условие 


у сага (бирр( А! (9) > сата(Х), (5) 


где Х={х,...х,} — исследуемая совокупность объектов, @ -ядра А'(&), 11... 
нечетких кластеров А'ЕР, [Е 1....,с} для некоторого & е (0}1] представляют собой 
нечеткие множества уровня, определяемые как А’(@)={(х,и“)| и“ > а}, так что 
А'(а)<А', ае(0, А Е{А.,....А}, и бирКА((а)) — носитель а-ядра А‘(@) 
нечеткого кластера А’ еР, причем биррА'(а)) = А', то есть носитель & -ядра нечет- 
кого кластера А' ЕР, /=1,...,с будет представлять собой @ -срез А" ={х ЕХ| и, >а} 
этого кластера при соответствующем значении @, а значения принадлежности 


объекта &@ -ядру определяются в соответствии с формулой 


В Доне, 
иг = . в. (6) 
2 Хх а 


Порог & выбирается таким образом, чтобы каждый объект х, Е Х, 1=1...., п при- 


надлежал бы по меньшей мере одному @ -ядру нечеткого кластера, и может вычисляться 
по формуле 


д =шиитахд, , (7) 


что, в свою очередь, позволило сформулировать теорему [20], в соответствии с кото- 
рой носители {А',...,А°} @м-ядер {А'(<),..., А‘(@)} кластеров нечеткого с-разбиения 
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Р*(Х)={А'.,..., А°} исследуемой совокупности объектов Х = {х,...,х,} образуют 
покрытие исследуемой совокупности Х = {х,...,х„} в том и только в том случае, когда 
а<а, аЕ(0,], где @ Е (0}1] вычисляется по формуле (7). 


Следствиями доказанной теоремы является ряд сформулированных также в [20] 
положений — в частности, если в условии (5) имеет место равенство, то носители 


{А',...А} @ -ядер кластеров нечеткого с -разбиения образуют разбиение исследуемой 
совокупности Х = {х,,...,х,} на непересекающиеся множества; кроме того, если &=@, 
где значение @ вычисляется по формуле (7), то покрытие, образуемое носителями 
(А',...А} @“-ядер {А'(@),..„А‘(а)} кластеров нечеткого с -разбиения Р(Х)={А',...А}, 
минимально. 


Концепция @-ядер нечетких кластеров позволяет, с одной стороны, отнести 
каждый объект исследуемой совокупности к наименьшему числу ©, 1<с <с нечетких 


кластеров нечеткого с-разбиения Р”(Х)={А'...., А}, являющегося результатом класси- 
фикации, а с другой — сохранить значения принадлежности и,, которые можно интер- 


претировать как степени обладания объектом х, е Х свойств класса, ассоциированного с 


1 
нечетким кластером А’, [Е {1,...,с} — элементом нечеткого с -разбиения Р“(Х). 


Общая схема последовательного применения методов 
нечеткой кластеризации в процессе анализа данных 


Как указывается в [20], «в случаях, когда объем исследуемой совокупности 
Х=1,...х) достаточно велик, носители {А',....А°} @а-ядер {А'(@),..., А‘ (“)} класте- 


ров нечеткого с-разбиения Р(Х)={А',...А’ могуг рассматриваться как множества 


объектов, подлежащие дальнейшей классификации». Данный тезис является отправной 
точкой при многоэтапном применении различных методов нечеткой кластеризации для 
осуществления структурной типологизации исследуемой совокупности объектов. 

В случае отсутствия априорных предположений о числе классов в исследуемой 


совокупности объектов целесообразно построить подмножество С= {с.,...с’} возможных 
значений числа классов в искомом нечетком с-разбиении, для чего можно восполь- 
зоваться предложенной в [19] методологией — в таком случае подмножество С’ будет 


представлять собой носитель нечеткого множества И = {с,,›(с,)}, с, ЕС, где значения 
функции принадлежности 1, (с,) интерпретируются как степени адекватности значений 


числа с, ЕС классов в искомом нечетком с -разбиении Р"(Х), что, с одной стороны, 
позволит содержательно оценить «степень возможности» того или иного значения 
числа классов с, ЕС, а с другой — применить (т)ЕСМ-СУ-алгоритм, позволяющий 
обрабатывать данные в полностью автоматическом режиме [19]. 

После разбиения исследуемой совокупности объектов с помощью некоторой 
кластер-процедуры группы оптимизационных методов нечеткой кластеризации на 
оптимальное, в смысле используемого показателя оптимальности, число с классов, сле- 
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дует выделить & -ядра нечетких кластеров полученного нечеткого с -разбиения Р“(Х), и 


дальнейший анализ проводить отдельно для каждой группы объектов, являющихся 
элементами носителя соответствующего & -ядра. 

Следует, однако, отметить, что при необходимости построения нечеткого с -разбие- 
ния АХ)={А,...А$}, в случае, когда носители @ -ядер {А'(0),..., °(а)} нечетких клас- 
теров образуют покрытие классифицируемого множества объектов, то, при принадлеж- 
ности объекта нескольким носителям @ -ядер нечетких кластеров, отнесение объекта к 
тому или иному классу можно производить в соответствии с правилом максимальной 
принадлежности, которое в рассматриваемом случае можно сформулировать следующим 
образом: если некоторый объект х, Е Х, 1Е\|,..„и} принадлежит носителю с -ядра более 


чем одного нечеткого кластера, то он должен быть отнесен к носителю а@ -ядра того 
нечеткого кластера, значение принадлежности д, которого в смысле определения (6) 


является наибольшим; при этом максимальное значение д, сохраняется, а значения при- 


надлежностей @ -ядрам других нечетких кластеров полагаются равными нулю; в случае 
же, если объект х, принадлежит носителям @ -ядер нескольких нечетких кластеров с 


одинаковыми значениями принадлежности и то х, относится к каждому такому а - 


ядру с этим значением д», и для таких элементов х, ЕХ строится матрица пересечений 
между классами. Сформулированное таким образом правило максимальной принад- 
лежности позволяет сохранить значение д, элемента х, еХ для содержательной интер- 


претации результатов классификации. Подобным образом могут интерпретироваться 
результаты, полученные с помощью О-АЕС(с)-алгоритма возможностной кластериза- 
ции [18], [21]. Если число объектов — элементов носителя &@ -ядра нечеткого кластера 
окажется приемлемым для использования иерархических кластер-процедур, то в подоб- 
ной ситуации оказывается возможным построение иерархии на элементах каждого выде- 
ленного класса объектов; в противном случае каждый класс аналогичным способом 
разбивается на субкластеры, и дальнейший анализ производится для субкластеров. 

Этап исследования межкластерных связей подразумевает замену каждого нечет- 
кого кластера его прототипом и применением к соответствующим точкам пространства 
["(Х) некоторого иерархического алгоритма нечеткой кластеризации, либо процедуры 
классификации на нечетких графах. Подобный методологический прием, позволяющий 
существенно сократить число классифицируемых объектов с целью применения иерар- 
хических кластер-процедур, описан на примере решения задачи экономико-геологичес- 
кого районирования территории, изложенном в [6]. 

Общая схема осуществления структурной типологизации множества объектов с 
помощью методов нечеткой кластеризации представлена на рис. 2. 

Необходимо указать, что, в силу большого разнообразия методов нечеткой клас- 
теризации и существования нескольких видов кластерных структур, характеризуемых 
размытостью, конкретный вариант представленной схемы диктуется, во-первых, усло- 
виями решаемой задачи и целями исследования, а во-вторых — особенностями того или 
иного алгоритма, применяемого на каждом этапе. Следует также отметить, что этапы, 
выделенные пунктирными овалами, могут отсутствовать при проведении того или иного 
конкретного исследования; кроме того, каждый из указанных этапов может реализовы- 
ваться с помощью различных кластер-процедур, что, в свою очередь, позволит углубить 
анализ и выявить устойчивость структуры, искомой на соответствующем этапе. 
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Рисунок 2 — Схема структурной типологизации исследуемой совокупности объектов, 
основанная на поэтапном применении методов нечеткой кластеризации 


Иллюстративный пример 


Представляется целесообразным проиллюстрировать сущность предложенной 
методологии на простом примере. Для проведения вычислительного эксперимента 
были выбраны изображенные на рис. 3 двумерные данные, представляющие собой 


совокупность 30 объектов Х = {х,,...,ху}. 
Визуальный анализ данных демонстрирует, что число классов в искомом нечет- 
ком с-разбиении Р“(Х) может варьироваться от 2 до 6 — так, можно выделить два 


класса объектов, в первый из которых попадают объекты с номерами от 1 по 19, а во 
второй — с 20 по 30 включительно, с другой стороны, рассматривая разбиение 
множества Х’ на три класса, можно выделить группы {х,....Х}, {%.,.. Хо} И {Х»-->Х} 


в свою очередь, разбиение множества Х’ на четыре класса состоит из групп {х,...%}, 
$». эХьХв»--эХоь 9 2»..3Х 5}, {Х»..зХу}, а разбиение Х на пять классов — из групп 
Поти Ооо а оный Обь № оным. Пригразбиений 
Х на 6 классов выделяются скопления {х,...,х;}, {%,...Хн}, {Хоз} {Хбь Хо} › 
{ХХ И {Хьь...Ху}, Однако объект х, занимает промежуточное положение между 
первой и второй группами, а объект х»„, — между пятой и шестой, из чего явно следует 


размытость границ классов объектов, что предполагает необходимость обращения к 
нечетким методам классификации. Этапы осуществления структурной типологиза- 
ции исследуемой совокупности, с указанием методов решения соответствующих за- 
дач, представлены в табл. 3. 
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Рисунок 3 — Двумерные данные для вычислительного эксперимента 


Таблица 3 — Этапы структурной типологизации анализируемой совокупности 


Номер и содержание этапа Метод решения задачи Ссылка 
Построение множества | Построение нечеткого множества наиболее 

] значений наиболее возможного числа нечетких кластеров с [9] 
возможного числа помощью О-АЕС-ТС-алгоритма 
классов возможностной кластеризации 


Построение нечеткого с -разбиения на 
оптимальное число классов с помощью 
(п)ЕСМ-СУ-алгоритма нечеткой 


Построение кластерной 


2 | структуры на 
множестве объектов 


[19] 


кластеризации 
Интерпретация 
3 | результатов нечеткой Выделение а -ядер нечетких кластеров [20] 
кластеризации 
Построение иерархий на подмножествах 
Исследование г. 
а объектов — элементов носителей а -ядер [5] 
. и: нечетких кластеров с помощью Н-АЕС-ТС- 
РВ алгоритма возможностной кластеризации 
Построение иерархии на множестве 
Исследование 
а прототипов нечетких кластеров с помощью 
5 | межкластерной ы [15] 
Н-АЕС-ТС-алгоритма возможностной 
структуры 


кластеризации 


При обращении к О-АЕС-ТС-алгоритму для построения нечеткого множества 
возможных значений числа классов И = {с,, из (с) с. ЕС= {,,...с’}, были проведены 


эксперименты с относительным обобщенным расстоянием Хемминга, относительным 
евклидовым расстоянием и относительной евклидовой нормой [19], [22]. При исполь- 
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зовании относительного обобщенного расстояния Хемминга было получено распреде- 
ление А”(Х) по 6 =5 нечетким @ -кластерам при а = 0,8000, а при использовании 
относительного евклидова расстояния и относительной евклидовой нормы было 
получено 6, =6, =4 при @, =0,8418 и а; = 0,9750 соответственно, что дало возмож- 
ность построить нечеткие числа И =(т =5,а, =4,6 =25), и И, =(т, =4,а, =3,Ь, =26),, 
объединение которых позволило построить нечеткую величину Г с непрерывной функ- 
цией принадлежности и,(]), и далее — нечеткое множество = {С и›(с,)}ь 


с, ЕС= {с, =4,....с’ =10} возможных значений числа классов. Следует указать, что носи- 


тели нечетких @ -кластеров — элементов соответствующих распределений А"(Х) пред- 
ставляют собой элементы экспертных разбиений на 4 и 5 классов. 
На рис. 4 а) символом о обозначены значения функции принадлежности д, (с,) 


нечеткого множества /={с,, м» (с,)}, с, Е {4,.. 10} возможных значений числа классов, а 


на рис. 4 6) — поведение для построенного Г обобщенного коэффициента разбиения 
Г. (Р) при обработке данных (т)ЕСМ-СУ-алгоритмом. 


Рисунок 4 — Построение нечеткого с -разбиения на оптимальное число классов: 


а) нечеткое множество Г = {с,, м; (с,)} возможных значений числа классов; 


6) значения Г. (Р) при обработке данных (т)ЕСМ-СУ-алгоритмом 


В свою очередь, на рис. 5 изображены значения принадлежностей в смысле выра- 
жения (6) элементов исследуемой совокупности &@ -ядрам нечетких кластеров построен- 


ного с помощью (п) ЕСМ-СУ-алгоритма нечеткого с -разбиения Р“(Х). Значения при- 


надлежности И’ первого класса изображены символом о, второго — символом №, 


третьего — символом с, четвертого — символом ®, пятого — символом У, и, наконец, 
шестого класса — символом А. Пороговое значение, вычисленное по формуле (7), соста- 


вило а =0,798097. Из рис. 5 очевидно, что носители с -ядер нечетких кластеров А еР’(Х), 
[=1,..,6, не пересекаются и соответствуют группам объектов экспертного разбиения на 
6 классов. 
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Рисунок 5 — Значения принадлежности объектов &@ -ядрам нечетких кластеров 
полученного нечеткого с-разбиения Р“(Х) на 6 классов 
При обращении к Н-АЕС-ТС-алгоритму возможностной кластеризации для выявле- 
ния иерархической структуры классов объектов — носителей & -ядер нечетких кластеров 
Р*(Х) эксперимент проводился с использованием относительного евклидова расстояния. 
На рис. 6 а) — е) изображены иерархии распределений К“(Х) по нечетким &@ -кластерам 
объектов, являющихся элементами носителей & -ядер нечетких кластеров — элементов 
построенного нечеткого с -разбиения Р“(Х). Типичные точки нечетких «и -кластеров рас- 


пределений К“(Х) для каждого значения уровня сходства © обозначены символом ®, а 


объекты х,, [Е {1,..,30} со значениями типичности, меньшими | — символом п. 
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Рисунок 6 — Иерархическая структура классов объектов -— носителей а -ядер 
нечетких кластеров Р“(Х) 
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Результаты классификации на данном этапе демонстрируют, что первый, третий 
и четвертый классы объектов однородны и обладают достаточно простой структурой, 
в то время как второй, пятый и шестой классы могут быть подразделены на суб- 
кластеры. Следует также отметить, что в построенных с помощью Н-АЕС-ТС- 
алгоритма иерархиях содержательный смысл значений типичности объектов для нечет- 


ких ( -кластеров распределений К“”(Х) ‚ как и смысл значений @ ‚ при которых эти рас- 
пределения получены, отличны от значений принадлежности и, объектов &@ -ядрам 


нечетких кластеров и соответствующего значения порога @ [18]. 
Иерархическая структура прототипов 7’, /=1....,6 нечетких кластеров А'.,..., А°, 


координаты которых, вычисленные с помощью (т)ЕСМ-СУ-алгоритма, приведены в 
табл. 4, изображена на рис. 7. При проведении вычислительного эксперимента с Н-АЕС- 


ТС-алгоритмом для построения иерархии прототипов 7’, /=1,...,6 также было исполь- 
зовано относительное евклидово расстояние. 


1 
Таблица 4 — Координаты прототипов 5| 5.619. 0,619, 1.000, 1,000, 1,000, 1,000, 
нечетких кластеров 
61 6.644 0,644] 0,644 1.000, 1,000, 1,000 
Номер Значения координат 4| 5000} 1.000 
ст с 
о. ы ь 8| 0.659 0,659] 
1 0,114676 | 0,113194 ›| 0.659) 0,659] 0.703 
2 0,072383 | 0,748145 
3 0.426081 [0.974915 1| 0615, 1000, 1,000, 1,000, 1,000, 1,000, 
4 0.499381 | 0,498146 0615 0,619 05644 0659 0103 100 @ 
5 0,911948 | 0,152280 Рисунок 7 — Иерархическая структура 
6 0,900523 0,803509 прототипов нечетких кластеров 


Представленная на рис. 7 иерархия прототипов отличается от иерархии рассмотрен- 
ных выше экспертных разбиений объектов по классам, что очевидно уже при а=0,619, 
когда исследуемая совокупность прототипов расслаивается на два класса. Данное обстоя- 
тельство объясняется свойствами транзитивного замыкания, используемого Н-АЕС-ТС- 
алгоритмом. 


Заключение 


Разнообразие методов нечеткой кластеризации позволяет использовать различные 
из них на каждом этапе исследования, и схема осуществления структурной типологиза- 
ции, диктуемая целями исследования, характером данных и имеющейся априорной инфор- 
мацией, может варьироваться в каждом конкретном случае. Таким образом, предложенная 
методология многоэтапной нечеткой кластеризации может быть эффективно использова- 
на при решении самых разнообразных задач, таких, к примеру, как анализ данных в соци- 
ально-экономических исследованиях, обработка результатов научных экспериментов, 
проектирование систем поддержки принятия решений, в том числе специального назна- 
чения, обработка и анализ изображений, а также для декомпозиции баз правил в системах 
нечеткого вывода. Помимо точности и релевантности результатов классификации, полу- 
ченных на каждом этапе, главным достоинством предложенного подхода к анализу 
данных является возможность обработки данных в полностью автоматическом режиме, 
что открывает широкие возможности для решения задач в условиях реального времени. 
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Р.А. Иайсйепт 

Ме®о9до105у о? аа Апа[у$5 Вазе4 оп МшИ$ асе Еи7ту Сш$егто 
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ехрегитепе ог фе апа[уз1$ оЁ Фе агайсла| дайа зе# 15 ргезеще4 ап4 ргешитагу сопс[аз1оп$ аге Фогииа{е4. 
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